草庐IT

Python库提取 \'epub\'信息

全部标签

python - 通过 lxml.etree.iterparse 解析单个文件中的多个 XML 声明

我需要解析一个包含各种XML文件的文件,即..等等。使用etree.iterparse时,出现以下(正确的)错误:lxml.etree.XMLSyntaxError:XMLdeclarationallowedonlyatthestartofthedocument现在,我可以预处理输入文件并为每个包含的XML文件生成一个单独的文件。这可能是最简单的解决方案。但我想知道是否存在针对此“问题”的适当解决方案。谢谢! 最佳答案 您提供的样本数据表明存在一个问题,而您提供的问题和异常则表明存在另一个问题。您是否有多个XML文档连接在一起,每个

xml - 删除命名空间并使用 XSL 提取 XML 文件的子集

当我的输入Xml为:DELHI所需的输出如下:DELHI以下xsl工作正常:但相同的XSL不适用于上述输入XML,如果添加了namespace:像下面这样:DELHI我希望删除namespace以及复制城市元素。如有任何帮助,我们将不胜感激。谢谢 最佳答案 这是关于XPath、XML和XSLT最多的常见问题解答。搜索“默认命名空间和XPath表达式”。至于解决方案:当此转换应用于提供的XML文档时:DELHI产生了想要的结果:DELHI解释:在XPath中,一个没有前缀的元素名总是被认为是在“无namespace”中。但是,所提供的

java - 我们如何使用 XMLEventReader 解析 DOCTYPE 信息?

我有一些现有代码可以解析顶级元素命名空间以确定我们正在查看的XML文件类型。XMLEventReaderreader=createXMLEventReader(...);try{while(reader.hasNext()){XMLEventevent=reader.nextEvent();switch(event.getEventType()){caseXMLStreamConstants.DTD://Noparticularlyusefulinformationhere?//((DTD)event).getDocumentTypeDeclaraion();break;caseXML

xml - 提取 xml 的节点值时出错。错误 : Namespace Manager or XsltContext needed

我正在尝试提取xml中节点的值。由于其namespace,我面临一些问题。在下面的xml中,我想要“faultstring”标记的值。ErrorInvalidcombinationofUsernameandPassword.我正在使用以下代码来获取值。但它会引发错误。DimxmlDocAsNewXmlDocumentDimnamespacesAsXmlNamespaceManager=NewXmlNamespaceManager(xmlDoc.NameTable)namespaces.AddNamespace("ns","SOAP-ENV")xmlDoc.Load("SOAP.xml"

python - 如何根据文本节点的值添加一个xml节点

我正在玩一个在@http://www.jsphylosvg.com/examples/source.php?example=2&t=xml找到的xml文件如果节点的值为name="Espresso",我想插入一个节点。例如我想更改为:Espresso2.0到:Espressowww.espresso.com2.0根据我迄今为止所做的研究,我可以使用xpath找到包含espresso的节点(这应该可行,但实际上不行?)importre,sysimportlxml.etreef=open("test.xml","r")data=f.read()tree=lxml.etree.XML(dat

python - 导入错误 : No module named elementtree. SimpleXMLWriter

在我的python代码中,我试图以XML格式显示输出。为此,我使用了XMLwriter。但是显示错误:Traceback(mostrecentcalllast):File"C:\Users\Ponmani\Desktop\test.cgi",line8,infromelementtree.SimpleXMLWriterimportXMLWriterImportError:Nomodulenamedelementtree.SimpleXMLWriter导致错误的行是:fromelementtree.SimpleXMLWriterimportXMLWriter我的整个python代码是:i

Python 2.6 xml.dom.ext 对象丢失?

我正在使用我在网上找到的脚本通过解析一些XML来转换一些文件。该脚本是在Python2.6中构建的,并且它使用的模块我认为通过我在网上阅读的内容不属于2.6。我想知道是否有解决方法。我得到的错误是:NoModulenameEXT在下面的脚本中,我认为它在importxml.dom.ext上挂了,它似乎只在PrettyPrint的最后使用了这个对象(见最后的Try语句)我想知道2.6中是否有解决方法?我似乎找不到包含我可以导入的EXT对象的模块。脚本是:fromxml.dom.minidomimportDocumentimportxml.dom.extimportstringimport

python - 如何在 python 中使用 xml.etree.ElementTree 解析当前节点中的所有子元素和孙元素

我正在提取xml文档中的所有文本。我想查找标签description,然后搜索所有子孙,可能还有更多元素,然后提取文本。这是我的代码,但它无法在孙子标签中获取文本:forelementinroot.find('description'):print'parent:',element.tag,'|',element.attribtry:data.write(element.text)forall_tagsinelement.findall('./'):print'child:',all_tags.tag,'|',all_tags.attribifall_tags.text:data.wr

python - OpenERP 使用新模块安装 xml 演示数据

对不起我的英语不好今天我正在尝试在OpenERPv7中开发一个新模块。我的模块完全按照我的意愿工作,但是当我与队友分享时,安装后他们必须手动插入大量数据以测试所有模块的功能。所以我建议创建一个包含一些演示数据的xml文件。我遵循此链接中的文档https://doc.openerp.com/trunk/server/03_module_dev_01/这是我的openerp.py的内容{'author':"Oussama",'version':'0.1','name':"SchoolManagement",'description':"MyModuleforschool",'categor

python xml pretty-print 不起作用

我正在通过从列表中添加一些节点和值来更改一些xml。我可以成功创建所有新标签和值,我在贡献者标签之间创建它们,但是当我将xml保存到新文件时,我创建的标签都在一行上。这是我的代码示例:templateXml="""newMovie"""fromlxmlimportetreetree=etree.fromstring(templateXml)node_video=tree.xpath('//feature/contributors')[0]forcastincastList:pageElement=etree.SubElement(node_video,'contributor')nod